فهرست مطالب

مجله علوم آماری
سال دوم شماره 2 (پیاپی 4، پاییز و زمستان 1387)

  • تاریخ انتشار: 1387/08/15
  • تعداد عناوین: 7
|
  • نسیم اجلالی، حمید پزشک * صفحات 131-148

    الگوی مارکوف پنهان در مسائل بیوانفورماتیک کاربرد فراوانی دارد. برای مثال این الگو در هم ردیفی دنباله ها، تفسیر خانواده های پروتئین و پیش بینی ژن بکار می رود. پارامترهای این الگو از طریق الگوریتم بام-ولش تعلیمی که یک الگوریتم EM است برآورد می شود. بکارگیری کارآمدترین الگوریتمها برای دنباله های طویل نیازمند حجم وسیعی از حافظه می باشد. در این مقاله روش های مختلفی از جمله استراتژی پیشرو و استراتژی پسرو را که به منظور کاهش حافظه این الگوریتم ارائه شده اند معرفی می کنیم. در ادامه الگوریتمی براساس مشاهدات از راست به چپ و از چپ به راست اعضای دنباله ارائه می شود که دارای حافظه خطی است. کارایی این الگوریتم بر روی داده های شبیه سازی شده از پروتئین ها بررسی می شود.

    کلیدواژگان: الگوی مارکوف پنهان، الگوریتم بام، ولش، الگوی دو طرفه، الگوی مارکوف پنهان پروفایل، حافظه خطی
  • نبز اسمعیل زاده، هوشنگ طالبی صفحات 149-162
    طرح های پلاکت – برمن در ادبیات مربوط به طرح به عنوان طرح های کسری نامنظم اشباع شده برای غربال کردن عامل های فعال شناخته می شدند. در دو دهه اخیر با معرفی تصویر پنهان این طرح ظرفیت آنها در برآورد اثرات متقابل دو عاملی توسط محققین متعددی مطالعه و ارائه شده است. در این تحقیق با استفاده از اصل تنک بودن اثرات قابلیت های جدید این طرح در شناسایی و برآورد اثرات متقابل سه عاملی مورد بررسی قرار گرفته است. برای این منظور طرح کاوش پسا مرحله ای معرفی شده است. این طرح امکان شناسایی و برآورد اثرات اصلی و اثرات متقابل دو عاملی که در مرحله قبل به عنوان اثرات فعال شناخته شده اند فراهم می آورد. نشان داده شده است که تصویر طرح پلاکت – برمن با 12 اجرا روی 4 و 5 عامل یک طرح پسا مرحله ای است.
    کلیدواژگان: طرح پلاکت، برمن، طرح کاوش، تصویر یک طرح
  • مهدی تذهیبی، نصرالله بشردوست، محبوبه احمدی صفحات 163-178
    در تحقیقات پزشکی از سطح زیر منحنی ROC برای ارزیابی آزمون غربالگری در تمایز بین افراد سالم و افراد بیمار و دسته بندی مدل ها در تصمیمات حمایتی، تشخیص و پیشگیری استفاده می شود. تجزیه و تحلیل این منحنی ها صحت توانائی مدل ها در جداسازی موارد مثبت از منفی را نشان می دهد. هرچند بنا به تعریف باید این منحنی هموار باشد، اما در مطالعات تجربی منحنی هایی ناهموار حاصل می شوند. لذا در این مقاله استفاده از هموارساز هسته ای برای برآورد این منحنی پیشنهاد شده است. سپس منحنی های ROC مربوط هورمون محرک تیروئید (TSH) نوزادان 3 تا 7 روزه استان اصفهان مربوط به طرح غربالگری تیروئید مادرزادی با روش های نرمال دو متغیره، تجربی و هموارسازی هسته ای برآورد شده اند. آنگاه برای ارزیابی این منحنی ها، سطح زیرمنحنی و انحراف معیار آن برآورد گردیده و برتری روش هموارسازی هسته ای نشان داده شده است.
    کلیدواژگان: هموارسازی هسته ای، منحنی ROC، هورمون محرک تیروئید، حساسیت ویژگی
  • احسان زمان زاده، ناصررضا ارقامی صفحات 179-200
    در این مقاله، ابتدا به معرفی دو برآوردگر جدید آنتروپی می پردازیم. برآوردگرهای جدید برمبنای تصحیح برآوردگر کوریا (1995) در نقاط ابتدایی و انتهایی و اعمال وزن های متفاوت نسبت به آن برآوردگر معرفی می شوند. سپس به مقایسه برآوردگرهای جدید آنتروپی با برآوردگرهای آنتروپی معرفی شده توسط واسیچک (1976) و ابراهیمی و همکاران (1994) و کوریا (1995) می پردازیم. آنگاه آزمون نیکویی برازش فرضیه های نرمال بودن و نمایی بودن را برمبنای برآوردگرهای جدید آنتروپی معرفی کرده و توان آن را با آزمون های مبتنی بر برآوردگرهای وسیچک (1976) و کوریا (1995) و آزمون شاپیرو-ویلک (1965) برآی آزمون های نرمال بودن مقایسه می کنیم. نتایج مطالعات شبیه سازی نشان می دهد که برآوردگرهای پیشنهادی عملکرد نسبتا خوبی نسبت به سایر برآوردگرها در برآورد آنتروپی و آزمون نیکویی برازش دارند.
    کلیدواژگان: آنتروپی، برآورد آنتروپی، آزمون نیکویی برازش، اطلاع کولبک لایبر
  • ملیحه عباس نژاد، مرضیه شکوری صفحات 201-211
    آزمون نیکویی برازش برای توزیع نمایی برمبنای آنتروپی اولین بار توسط ابراهیمی و همکاران (1992) به کمک برآورد اطلاع کولبک لایبلر معرفی شد. ما در این مقاله ابتدا اطلاع رنی را به روشی همانند روش به کار گرفته شده توسط کوریا (1995) برای برآورد آنتروپی شانون، برآورد نموده و سپس از آن به عنوان آماره آزمون نمایی بودن توزیع استفاده می کنیم. در ادامه توان آزمون های پیشنهادی را با چند آزمون دیگر به کمک شبیه سازی مقایسه کرده و نشان می دهیم که روش ارائه شده به نسبت برخی از آزمون های معروف توان بالاتری دارد.
    کلیدواژگان: آنتروپی، اطلاع کولبک لایبلر، اطلاع رنی، آزمون نمایی بود
  • هادی علیزاده نوقابی، ناصررضا ارقامی، رضا علیزاده نوقابی صفحات 213-227
    در این مقاله سه برآوردگر مختلف آنتروپی ارائه و از نظر اریبی و جذر میانگین توان دوم خطا با یکدیگر مقایسه می شوند. سپس براساس این برآوردگرها سه آزمون نمایی بودن جدید معرفی و در یک مطالعه شبیه سازی، توان آن ها مورد ارزیابی و مقایسه قرار می گیرند.
    کلیدواژگان: برآوردگرهای آنتروپی، برآوردگر تابع کرنل چگالی، اریبی، جذر میانگین توان دوم خطا، آزمون نمایی بودن، توان آزمون
  • رحمان فرنوش، افشین فلاح، آرزو حاج رجبی صفحات 229-243
    برای آزمون فرضیه همگنی مدل های آمیخته، معمولا از آزمون نسبت درستنمایی اصلاح شده که مبتنی بر افزودن یک تابع تاوان مناسب به تابع لگ درستنمایی می باشد، استفاده می شود. کارایی این آزمون به شدت تحت تاثیر شکل تابع تاوان انتخابی است. انتخاب تابع تاوان در این نوع آزمون معمولا براساس پرهیز از پیچیدگی و میسر بودن برآورد پارامترها صورت می پذیرد، که لزوما نتایج مطلوبی به دنبال ندارد. در این مقاله یک تابع تاوان جامع در نظر گرفته شده است، که دارای یک پارامتر تعیین کننده شکل است. سپس پارامتر تعیین کننده شکل این تابع با استفاده از رهیافت بیزی، به صورت پسینی برآورد شده اند. نشان داده شده است که رهیافت بیزی پیشنهادی در برآورد پارامترهای مدل، در مقایسه با رهیافت بسامدی، به مراتب کارایی مطلوب تری دارد. این کارایی خصوصا در شرایط شناخت ناپذیری توزیع آمیخته که روش های بسامدی کارایی اندکی دارند، بیشتر است.
    کلیدواژگان: آزمون نسبت درستنمایی، تابع تاوان، الگوریتم EM، زنجیرهای مارکوف مونت کارلوئی
|
  • Nasim Ejlali, Hamid Pezeshk Pages 131-148

    Hidden Markov models are widely used in Bioinformatics. They are applied to protein sequence alignment, protein family annotation and gene-finding.The Baum-Welch training is an expectation-maximization algorithm for training the emission and transition probabilities of hidden Markov models. For very long training sequence, even the most efficient algorithms are memory-consuming. In this paper we discuss different approaches to decrease the memory use and compare the performance of different algorithms. In addition, we propose a bidirection algorithm with linear memory. We apply this algorithm to simulated data of protein profile to analyze the strength and weakness of the algorithm.

  • Nabaz Esmaeilzadeh, Hooshang Talebi Pages 149-162
    So far, the Plackett-Burman (PB) designs have been considered as saturated non-regular fractional factorial designs for screening purposes. Since introduction of the hidden projection of PB's by Wang and Wu (1995), the estimation capability of such projections onto a subset of factors has been investigated by many researchers. In this paper, by considering the search and estimation capability of a design, we introduce the post-stage search designs, using sparsity principle of factorial effects. That is, by the post-stage property of a design, we mean the capability of such a design in searching and estimating possible nonzero 3-factorial interactions along with estimation of the general mean, main effects and active 2-factor interaction effects, identified in the pre-stage. We show that a 12-runs PB projections onto 4 and 5 factors are post-stage search designs.
  • Mehdi Tazhibi, Nasollah Bashardoost, Mahboubeh Ahmadi Pages 163-178
    Receiver Operating Characteristic (ROC) curves are frequently used in biomedical informatics research to evaluate classification and prediction models to support decision, diagnosis, and prognosis. ROC analysis investigates the accuracy of models and ability to separate positive from negative cases. It is especially useful in evaluating predictive models and in comparing with other tests which produce output values in a continuous range. Empirical ROC curve is jagged but a true ROC curve is smooth. For this purpose kernel smoothing is used. The Area Under ROC Curve (AUC) is frequently used as a measure of the effectiveness of diagnostic markers. In this study we compare estimation of this area based on normal assumptions and kernel smoothing. This study used measurements of TSH from patients and non-patients in congenital hypothyroidism screening in Isfahan province. Using this method, TSH ROC curves from infants in Isfahan were fitted. For evaluating of accuracy of this test, AUC and its standard error calculated. Also effectiveness of the kernel methods in comparison with other methods are showed.
  • Ehsan Zamanzadeh, Naser Arghami Pages 179-200
    In this paper, we first introduce two new entropy estimators. These estimators are obtained by correcting Corea(1995)'s estimator in the extreme points and also assigning different weights to the end points.We then make a comparison among our proposed new entropy estimators and the entropy estimators proposed by Vasicek (1976), Ebrahimi, et al. (1994) and Corea(1995). We also introduce goodness of fit tests for exponentiality and normality based on our proposed entropy estimators. Results of a simulation study show that the proposed estimators and goodness of fit tests have good performances in comparison with the leading competitors.
  • Maliheh Abbasnejad, Marzeiyeh Shakouri Pages 201-211
    In this paper, we establish a goodness of fit test for exponentiality based on the estimated Renyi information. We use an estimator for Renyi distance in manner of Correa entropy estimate. Critical values of the test are computed by Monte Carlo simulation. Also we compute the power of the test under different alternatives and show that it compares favorably with the leading competitor.
  • Hadi Alizadeh, Naser Arghami, Reza Alizadeh Pages 213-227
    In this paper we first give three different entropy estimators and we compare them in terms of bias and root of mean squared error. Also the paper studies three entropy tests of exponentiality using three statistics based on different entropy estimates. By simulation, we next compare the power of these tests.
  • Rahman Farnoosh, Afshin Fallah, Arezoo Hajrajabi Pages 229-243
    The modified likelihood ratio test, which is based on penalized likelihood function, is usually used for testing homogeneity of the mixture models. The efficiency of this test is seriously affected by the shape of penalty function that is used in penalized likelihood function. The selection of penalty function is usually based on avoiding of complexity and increasing tractability, hence the results may be far from optimality. In this paper, we consider a more general form of penalty function that depends on a shape parameter. Then this shape parameter and the parameters of mixture models are estimated by using Bayesian paradigm. It is shown that the proposed Bayesian approach is more efficient in comparison to modified likelihood test. The proposed Bayesian approach is clearly more efficient, specially in nonidentifiability situation, where frequentist approaches are almost failed.